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1. WSTĘP 


W latach siedemdziesiątych kilku badaczy sztucznej inteligencji w USA 
zwróciło swoje zainteresowania na obszar uważany jak dotąd jedynie za domenę 
geniuszu - odkrycia naukowe. Chodziło o zaprojektowanie i uruchomienie sys- 
temów komputerowych, które miały modelować rzeczywisty historyczny proces 
odkrycia naukowego w dziedzinach takich jak matematyka, fizyka, chemia, czy 
biologia. Teoria odkryć maszynowych leży na obszarze zainteresowań zarówno 
filozofii nauki, jak i samej nauki. Jest formą ścisłego uprawiania filozofii nauki 
zmuszającą do dbałości o szczegóły i precyzyjnego wyartykułowania swoich idei. 
Współczesne systemy odkryć mają też coraz większe znaczenie dla samej nauki: 
Są one w stanie znaleźć równania empiryczne pasujące do danych wejściowych 
w laboratorium, przeanalizować bazy danych pod kątem użytecznej wiedzy, for- 
mułować i uzasadniać hipotezy na temat ukrytej struktury materii wyjaśniającej 
zjawiska obserwowalne. W idealnym, docelowym przypadku możemy sobie ta- 
kiego maszynowego odkrywcę wyobrazić jako robota, który przeprowadza ekspe- 
rymenty i rozwija teorie na podstawie analizy uzyskiwanych danych’. 


l Patrz J. M. Żytkow, Automatyzacja odkrycia naukowego: stan i perspektywy, „Filozofia 
Nauki” 1993, 4, s. 38-54. Jest to, o ile wiem, pierwsza opublikowana w Polsce praca poświęcona 
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Teoria odkryć maszynowych nigdy nie ograniczała się do konstruowania 
systemów dokonujących odkryć o charakterze empirycznym bądź teoretycznym 
w dziedzinie nauk przyrodniczych. Od samego początku równolegle z nimi po- 
wstawały systemy dokonujące odkryć w dziedzinie matematyki (głównie arytme- 
tyki liczb naturalnych i teorii zbiorów)”. Ponadto, w ciągu ostatnich kilku lat 
można zaobserwować gwałtowny wzrost zainteresowania badaczy konstruowa- 
niem systemów dokonujących odkryć w bazach danych*. Odkrycia dokonywane 
w bazach danych są interesujące z kilku powodów. 

Wielkie (rzędu giga- i terabajtów) bazy danych są powszechnie spotykane 
w biznesie, nauce, służbie zdrowia czy technice. Interesujące historycznie infor- 
macje, np. dotyczące wahań giełdowych, czy pogody są dostępne właśnie w pos- 
taci baz danych. Każda duża firma wkłada wiele wysiłku w zaprojektowanie 
i aktualizowanie baz danych. Wielkie bazy danych nie zostały nigdy systema- 
tycznie zbadane pod kątem znalezienia interesujących prawidłowości. Ze 
względu na ich rozmiar, odkrycie takich prawidłowości przez ludzkiego badacza 
jest po prostu niemożliwe. 

Zbadanie tych baz danych i wykrycie w nich ciekawych regularności stano- 
wi interesujące wyzwanie dla systemów odkryć maszynowych. Nie bez znaczenia 
jest fakt, do którego badacze raczej niechętnie się przyznają, że odkrycia w ba- 
zach danych są źródłem dużych pieniędzy. Wiele firm czy agencji rządowych 
jest gotowych wydać znaczne fundusze na wspieranie badań nad konstruowaniem 
systemów dokonujących takich odkryć. Co więcej, ponieważ operowanie goto- 
wym systemem jest skomplikowane i wymaga znajomości specyfiki zarówno sa- 
mego systemu, jak i środowiska, w którym on funkcjonuje”, pojawia się intratna 
profesja „operatora” systemów dokonujących odkryć w bazach danych. 

W pracy niniejszej koncentruję się na systemach dokonujących odkryć w 
naukach przyrodniczych, głównie w fizyce. O ile odkrycia w bazach danych 


systemom odkryć maszynowych, napisana przez jednego z najwybitniejszych badaczy zajmujących 
się tą dziedziną. Praca zawiera bogatą bibliografię. 


2 Jednym z pierwszych takich systemów był AM (Artificial Mathematician). Patrz D. B. 
Lenat, Automated Theory Formation in Mathematics, „Proceedings of the Fifth International Joint 
Conference on Artificial Intelligence" 1977, s. 833-842. 


3 Patrz np. prace zbiorowe: G. Piatetsky-Shapiro, (ed.), „Proc. of AAAI-91 Workshop on 
Knowledge Discovery in Databases” 1991, San Diego, CA.; J. M. Żytkow, (ed.), „Proc. of the ML- 
92 Workshop on Machine Discovery, National Institute for Aviation Research”, 1992, Wichita, KS. 


4 System odkrycia (discovery system) to z reguły program napisany w języku LISP, którego 
uruchomienie i użycie wymaga umiejętności posługiwania się interpreterem LISP w środowisku 
systemu operacyjnego UNIX. 
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mają ogromne znaczenie praktyczne, o tyle zastosowanie systemów odkryć do 
nauk przyrodniczych jest interesujące zarówno z punktu widzenia filozofii nauki, 
jak i samej nauki. 

W części 2 przedstawiam systemy odkryć empirycznych. Część 3 poświęco- 
na jest systemom odkrywającym strukturę materii. Wreszcie w części 4 podsu- 
mowuję rozważania na temat systemów odkryć wskazując na perspektywy ich 
rozwoju oraz implikacje dla nauki i filozofii nauki. 


2. SYSTEMY ODKRYĆ EMPIRYCZNYCH 


Systemy odkryć naukowych pojawiły się w latach siedemdziesiątych. Po- 
czątkowo były to proste systemy, których zadaniem było poszukiwanie regular- 
ności typu numerycznego w sztucznie spreparowanych „danych” empirycznych. 
Stopniowo, w miarę doskonalenie stosowanych metod heurystycznych, zaczęto 
tworzyć systemy, które były w stanie sformułować proste prawa fizyki takie jak 
np. równanie stanu gazu doskonałego, prawo załamania światła, prawo Coulomba, 
prawo spadku swobodnego Galileusza, czy prawo Blacka (bilans cieplny). Kolejne 
systemy stawały się coraz doskonalsze przechodząc swego rodzaju ewolucję. 

Można podać kilka kryteriów oceny takich systemów wskazujących na wy- 
raźny postęp w tej dziedzinie. Pierwsze z nich związane jest z formą odkrywa- 
nych praw i proponowanych „terminów teoretycznych”. Drugie dotyczy możli- 
wości określenia przez system zakresu stosowalności odkrytych praw. Trzecie 
wreszcie, związane jest z projektowaniem i wykonywaniem przez system nowych 
eksperymentów. 

Również mechanizmy heurystyczne wbudowane w większość systemów od- 
kryć empirycznych posiadają pewne wspólne cechy, takie jak definiowanie no- 
wych terminów, dostosowanie metod przeszukiwania do charakteru napotkanych 
regularności, czy rekurencyjne stosowanie tych samych metod do nowych przy- 
padków. Szerzej o ewolucji metod heurystycznych na przykładach kolejnych sys- 
temów i o kryteriach ich oceny piszę w innej pracy”. W tym miejscu ograniczę 
się do pobieżnego omówienia kiłku historycznie ważnych systemów starając się 
uwypuklić aspekty filozoficzne bez wdawania się w szczegóły techniczne. 

Pierwszym historycznie systemem odkryć empirycznych, działającym zgodnie 
ze wspomnianymi metodami heurystycznymi, był System Indukcji Zależności 


5 p, Giza, O systemach odkryć naukowych, „Zeszyty Lubelskiego Towarzystwa Sztucznej 


Inteligencji”, 1995, (w przygotowaniu). 
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Funkcyjnych (Function Induction System) opracowany przez Gerwina*. Zada- 
niem, jakie postawił sobie Gerwin była rekonstrukcja mechanizmów heurystycz- 
nych rozumowania ludzkiego w sytuacji problemowej polegającej na odgadnięciu 
skomplikowanych zależności funkcyjnych jednej zmiennej na podstawie danych 
obarczonych pewnym błędem statystycznym. Gerwin zastosował w swoim syste- 
mie reguły poszukiwań heurystycznych wzorowanych na zachowaniu się ludz- 
kich naukowców-eksperymentatorów, których poddał skrupulatnemu badaniu 
w analogicznej sytuacji problemowej. Stwierdził on przede wszystkim, że ekspe- 
rymentatorzy z reguły stosują reguły heurystyczne wykrywania prawidłowości 
funkcyjnych (takich jak np. monotoniczność, okresowość itd.) zamiast statystycz- 
nych algorytmów dopasowania krzywych do danych. Był to istotny krok definiu- 
jący w pewnym sensie zadania systemów odkryć empirycznych. 

Chociaż system Gerwina miał poważne ograniczenia”, to wytyczył kierunki 
dalszych badań w dziedzinie odkryć praw numerycznych. Przede wszystkim, po- 
kazał że problem ten poddaje się heurystycznym metodom przeszukiwania, które 
już wcześniej z powodzeniem stosowane były przy próbach wyjaśniania prze- 
jawów inteligentnego ludzkiego zachowania. 

Następnym krokiem rozwojowym w dziedzinie odkryć empirycznych był 
system BACON?. Dostawał on na wejściu zbiór niezależnych zmiennych o war- 
tościach mierzalnych i żądał podania wartości zmiennych zależnych. Przykła- 
dowo, zmiennymi niezależnymi mogły być ciśnienie P, temperatura Ti masa ga- 
zu M, a zmienną zależną - objętość V. Wielkości niezależne mogły w systemie 
przyjmować zarówno wartości liczbowe, jak i symboliczne, natomiast wielkości 
zależne, jedynie wartości liczbowe. 

BACON ponownie odkrył wiele praw znanych z historii fizyki i chemii eks- 
perymentalnej, o których wspomniałem na wstępie tej części pracy. Podobnie jak 
w systemie Gerwina, podstawą działania systemu było odkrywanie zależności 
funkcyjnej pomiędzy dwiema wielkościami liczbowymi. BACON dokonywał 
tego poprzez zastosowanie trzech prostych dyrektyw heurystycznych. 


6 D. G. Gerwin, Information Processing, Data Inferences, and Scientific Generalization, 
"Behavioral Sciences” 1974, 19, s. 314-325. 


7 System mógł odkrywać jedynie funkcje jednej zmiennej, a definiowane przez niego 
terminy miały bardzo prostą postać. Przede wszystkim jednak, system był testowany jedynie na 
sztucznie wygenerowanych zbiorach danych. Tym samym jego przydatność do dokonywania od- 
kryć w realnym świecie pozostaje niejasna i raczej wątpliwa. 


8 G. L. Bradshaw, P. Langley, and H. Simon, H. BACON.4: The Discovery of Intrinsic 
Properties, "Proceedings of the Third Biennial Conference of the Canadian Society for Compu- 
tationał Studies of Intelligence" 1980, s. 19-25. 
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Reguła 1. 
Jeśli wraz ze wzrostem Y wzrasta X - zdefiniuj stosunek X/Y i zbadaj, 
jak zachowują się jego wartości. 

Reguła 2. 
Jeśli wraz ze wzrostem Y maleje X - zdefiniuj iloczyn XY i zbadaj, jak 
zachowują się jego wartości. 

Reguła 3. 
Jeśli wartości X są bliskie stałej, to wysuń hipotezę, że wartość X jest 
zawsze stała. 


Mimo swej prostoty, powyższe reguły heurystyczne działając razem decydują 
o poważnym potencjale odkrywczym systemu. BACON wspaniale „radzi” sobie 
z prostymi prawami w rodzaju prawa spadku swobodnego Galileusza. Analiza 
danych wejściowych i kolejne zastosowanie tych reguł pozwalają mu sformuło- 
wać to prawo w postaci: D/T”=const, gdzie D jest odległością przebywaną przez 
swobodnie spadające ciało, a T czasem spadania. 

Znacznie bardziej skomplikowane jest funkcjonowanie systemu w przypadku 
zależności z wieloma zmiennymi, takimi jak wspomniane już prawo bilansu 
cieplnego (prawo Blacka)”: 


(c;,M; + cM3)T; = c;M,T, + czM2T; 


gdzie: c, M, T, i odpowiednio c, M, T, oznaczają ciepła właściwe, masy 
i temperatury dwu cieczy (np. wody i rtęci) zmieszanych w kalory- 
metrze, a 7, — temperaturę końcową mieszaniny. 


W świetle przytoczonych na wstępie tej części pracy kryteriów oceny sys- 
temów odkryć empirycznych BACON stanowi znaczny postęp w porównaniu 
z systemem Gerwina szczególnie pod względem formułowania praw i definio- 
wania nowych terminów, w tym również terminów reprezentujących wewnętrzne 
własności substancji takich jak ciepło właściwe. 

System nie ma jednak wbudowanych mechanizmów analizy zakresu stoso- 
walności odkrywanych zależności numerycznych. Przykładowo, prawo Blacka 
w przytoczonej tu postaci, choć słuszne w szerokim zakresie temperatur, nie 
uwzględnia jednak przejść fazowych (np. topnienia lub krzepnięcia). Co więcej, 
możliwości systemu związane z przeprowadzaniem eksperymentów są poważnie 


4 Szerzej omawiam to zagadnienie w pracy P. Giza, O systemach... 
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ograniczone i niedoskonałe. Sprowadzają się one do wbudowanych mechaniz- 
mów kombinatorycznego generowania danych wejściowych na podstawie zna- 
nych systemowi wartości zmiennych niezależnych. Poważną wadą systemu jest 
brak możliwości „adaptacji do danych” - inteligentnego generowania ekspery- 
mentów w zależności od charakteru dokonanych obserwacji. 

Wspomnianych wad nie ma już następca BACONA - FAHRENHEIT”, który 
jak przyznaje jego twórca, jest w istocie znacznie zmodyfikowaną wersją 
BACONA. Podobnie jak jego poprzednik, system formułuje prawa empiryczne i 
definiuje terminy „teoretyczne” przy pomocy wielkości obserwowalnych. Zasad- 
nicza różnica polega natomiast na postaci formułowanych przez system praw. 

Formułując zależności liczbowe FAHRENHEIT wyposaża je w warunki gra- 
niczne: minimalne i maksymalne wartości zmiennych niezależnych, dla których 
dane prawo jest słuszne. Te dodatkowe zmienne traktowane są przez system na 
równi z pozostałymi zmiennymi. Oznacza to, że system stara się ustalić ich za- 
leżność od pozostałych zmiennych niezależnych. 

Jeśli system w trakcie przeprowadzania eksperymentów znajdzie wartości 
graniczne, dła których prawo przestaje być słuszne, to rekurencyjnie stosuje pro- 
cedurę polegającą na dzieleniu przez dwa przedziału pomiędzy najmniejszą znaną 
wartością, dla której prawo nie jest już słuszne, a największą znaną wartością, 
dla której jest ono jeszcze słuszne. Ta procedura generowania eksperymentów 
jest kontynuowana aż do osiągnięcia wymaganej dokładności. 

Postępując w naszkicowany sposób FAHRENHETT jest w stanie odkryć skom- 
plikowane prawa z wieloma zmiennymi oraz podać zakres ich stosowalności. 

Podsumowując rozważania na temat omawianego systemu, nałeży stwierdzić, 
że wprowadza on kilka istotnych ulepszeń w porównaniu ze swym poprzed- 
nikiem - BACONEM. Przede wszystkim FAHRENHEIT jest w stanie reprezen- 
tować zakres słuszności odkrywanych praw przy pomocy wbudowanych reguł 
heurystycznych. Wymaga to między innymi selektywnego procesu przeprowa- 
dzania eksperymentów i „inteligentnego” gromadzenia danych. Ponadto system 
może zmieniać kolejność rozważanych zmiennych niezależnych, co w pewnych 
przypadkach pozwala mu odkryć regularności niedostrzegane przez BACONA 
oraz może pomijać w dalszej analizie zmienne nieistotne, nie mające wpływu na 
badane parametry. 

Niemniej jednak, jak przyznają twórcy FAHRENHEITA, reprezentacja którą 
się on posługuje (przede wszystkim przy określaniu zakresu stosowalności praw) 


10 J, M. Żytkow, Combining many searches in the FAHRENHEIT discovery system, 
„Proceedings of the Fourth International Workshop on Machine Learning” 1987, s. 281-287. 
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przypomina raczej zabawę w liczby (number games) i niewiele mówi o jakościo- 
wej strukturze realnych fizycznych układów, do których odnoszą się odkrywane 
prawa. 

Następnym istotnym krokiem rozwojowym w dziedzinie systemów odkryć 
empirycznych jest system IDS'! (Integrated Discovery System) po raz pierwszy 
opisany w 1986 r. Stanowi on właściwie program badawczy będący w ciągłym 
rozwoju, oparty na zupełnie innym, znacznie bogatszym od poprzednich syste- 
mów, sposobie reprezentowania badanych układów fizycznych. 

IDS reprezentuje układy fizyczne przy pomocy tzw. schematów jakościo- 
wych, które określają zmiany w czasie atrybutów jednego lub kilku obiektów. 
Schemat składa się ze skończonej liczby stanów, w jakich układ znajduje się w 
kolejnych przedziałach czasowych. Dla analizowanej już sytuacji wymiany ciepła 
między dwoma ciałami (prawo Blacka) schemat składa się z trzech stanów. 
Każdy z nich opisywany jest przez wartości określonych atrybutów i ich zmian 
w czasie (tzw. pochodnych jakościowych). Pierwszy opisuje ciała o stałych 
w czasie temperaturach przed ich zetknięciem. Odległość ciał jest większa od ze- 
ra a ich stałe w czasie temperatury różnią się od siebie. Drugi stan opisuje układ 
po zetknięciu ciał, lecz przed wyrównaniem się temperatur. Odległość ciał równa 
się zeru, przyrosty temperatury ciała cieplejszego są ujemne, a zimniejszego 
dodatnie. Wreszcie trzeci stan opisuje układ po wyrównaniu się temperatur: od- 
ległość ciał równa się zero, ich temperatury są równe i stałe w czasie. 

Powyższy sposób opisu układów fizycznych pozwala systemowi IDS zrelaty- 
wizować odkrywane prawa do konkretnego obiektu i konkretnej chwili czasu. 
Daje to podwójne korzyści: 

Po pierwsze, schematy jakościowe definiują kontekst, w którym odkrywane 
prawa nabierają sensu - jeśli układ nie pasuje do opisanego schematu, to nie ma 
sensu mówić o prawie Blacka. Co więcej, reprezentacja taka jest w stanie zdać 
sprawę z przejść fazowych, a więc wychwycić temperatury topnienia i wrzenia 
oraz czasy trwania przejść fazowych, co pozwała określić odpowiednio ciepło 
topnienia i parowania. Tym samym pozwala w naturalny, jakościowy sposób 
sformułować warunki ograniczające słuszność prawa Blacka, podczas gdy 
FAHRENHEIT uchwycił te ograniczenia czysto ilościowo. 

Po drugie, schematy jakościowe zawężają przestrzeń poszukiwań dla praw 
ilościowych. określając masy, początkowe temperatury i własności wewnętrzne 
substancji biorących udział w wymianie ciepła. 


p Langley, B. Nordhausen, A framework for empirical discovery, „Proceedings of the 


International Meeting on Advances in Learning” 1986, Les Arcs, France. 
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System IDS znajduje się ciągle we wczesnej fazie rozwojowej, choć jest 
ciągle wzbogacany i udoskonalany. Nie posiada on tak wyrafinowanych mecha- 
nizmów badania granic stosowalności praw jak np. FAHRENHEIT. Niemniej 
jednak jest oceniany jako najbardziej obiecujący spośród systemów odkryć empi- 
rycznych, a to ze wzglądu na fakt integrowania w sobie możliwości odkrywania 
zarówno praw jakościowych, jak iłościowych, co jest podstawowym zadaniem 
przyszłych systemów odkryć. 


3. SYSTEMY ODKRYWAJĄCE STRUKTURĘ MATERII 


Równolegle z rozwojem systemów dokonujących odkryć empirycznych trwa- 
ły prace nad komputerową rekonstrukcją odkrywania ukrytej struktury materii. 
Zaowocowały one powstaniem już na początku lat osiemdziesiątych pierwszych 
systemów dokonujących odkryć w dziedzinie chemii, fizyki i genetyki. Systemy 
te, jak postaram się wykazać, są znacznie bardziej interesujące z punktu widzenia 
filozofii nauki niż systemy odkryć empirycznych. 

Pierwszym z tych systemów był DENDRAL. Zajmował się on rekonstruk- 
cją struktury molekuł związków organicznych tworząc dla danego wzoru suma- 
rycznego związku chemicznego wszystkie możliwe izomery. 

Kolejny system, STAHL”? opracowany w 1986 roku analizował reakcje che- 
miczne i stwierdzał, które substancje są pierwiastkami, a które związkami che- 
micznymi oraz starał się ustalić ich skład. Ta sama grupa badaczy, w rok póź- 
niej, dokonała kolejnego kroku na drodze komputerowej analizy ukrytej struktu- 
ry - opracowany przez nich system DALTON? był już w stanie zaproponować 
skład atomowy molekuł substancji chemicznych. 

Metody wypracowane przy konstrukcji tych systemów zostały następnie 
zastosowane do fizyki cząstek elementarnych Udoskonalona wersja STAHLa 
oraz system REVOLVER!’ zajmowały się odkrywaniem struktury kwarkowej 


12 R, Lindsay, G. M. Buchanan, E. A. Feigenbaum, R. Lederberg, Applications of Artificial 
Intelligence for Organic Chemistry; The DENDRAL Project, 1980, New York, McGraw-Hill. 


B3 J, M. Żytkow, H. A. Simon, A Theory of Historical Discovery: The Construction of 
Componential Models, „Machine Learning” 1986, 1, s. 107-136. 


14 p, Langley, H. Simon, G. L. Bradshaw, J. M. Żytkow, Scientific Discovery: Computatio- 
nal Explorations of the Creative Processes, 1987, MA, the MIT Press. 


15 D, Rose, Using Domain Knowledge to Aid Scientific Theory Revision, „Proceedings of 
the Sixth International Workshop on Machine Leaming” 1989, San Mateo, CA, Morgan Kaufmann 
Publishers, s. 272-277. 
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cząstek elementarnych. Jednak najdoskonalszym oraz najważniejszym poznawczo 
systemem generującym modele kwarkowe jest, opracowany w 1990 r. system 
GELL-MANN"'', któremu ze względu na jego znaczenie poznawcze poświęcę 
nieco więcej miejsca. 

System ten wyróżnia bogactwo reprezentowania modeli kwarkowych. Jako 
jedyny wprowadza on bowiem atrybuty dla postulowanych cząstek sub-elemen- 
tarnych. Przede wszystkim jednak, system dokonuje wyczerpującego przeszuki- 
wania wszystkich możliwych modeli kwarkowych w poszukiwaniu najprostszego 
modelu, adekwatnego do danych. Tym samym możemy tu mówić nie tylko o po- 
szukiwaniu, ale i uzasadnieniu słuszności znalezionego modelu kwarkowego. 

Zadaniem GELL-MANNa było zanalizowanie danych na temat cząstek 
elementarnych (dokładniej: hadronów) znanych w 1964 roku i sformułowanie na 
tej podstawie hipotezy (lub hipotez) na temat istnienia prostszej, ukrytej w nich 
struktury materii. Jednak pomimo całkowitej zgodności wyników, GELL-MANN 
dochodzi do hipotezy o istnieniu kwarków na zupełnie innej drodze, niż zrobili 
to fizycy-teoretycy w roku 1964". 

Rozważania, które doprowadziły fizyków do modelu kwarkowego były prze- 
prowadzane na poziomie modeli teoretycznych. Chodziło o znalezienie najprost- 
szej reprezentacji tzw. grupy symetrii SU(3), przy pomocy której udało się upo- 
rządkować odkryte hadrony. Ustalenie liczb kwantowych kwarków było już spra- 
wą względnie prostą, podyktowaną wymogami formalizmu teorii. 

GELL-MANN „rozumuje” natomiast na poziomie praw fenomenologicz- 
nych. Zamiast stosować wyrafinowany formalizm relatywistycznej, kwantowej 
teorii pola i teorii grup, system przeszukuje ogromną przestrzeń możliwych 


lo P. Fisher, J. M. Żytkow, Discovering Quarks and Hidden Structure, 1990, 5, s. 362-370. 


[w:] Z. Ras, M. Zemankova, and M. Emrich, (ed.), Methodologies for Intelligent Systems, New 
York, Elsevier Science Publishing Co. 


17 Jak argumentuje w pracy P. Giza, Intelligent Computer Systems and Theory Comparison, 
[w:] L. Koj, (ed.) On Theory Comparison, 1995, Rodopi Publishing House, Austria (w przygoto- 
waniu), nawet najbardziej zaawansowane współczesne systemy odkrywające strukturę materii „ro- 
zumują” na innym poziomie niż ludzcy odkrywcy teoretycy. Podział ten odpowiada rozróżnieniu 
pomiędzy teoriami i prawami fenomenologicznymi wprowadzonemu przez N. Cartwright w książce 
How the Laws of Physics Lie?, 1983, Oxford, Clarendon Press. Te pierwsze (jak np. relatywistycz- 
na, kwantowa teoria pola) mają za zadanie wyjaśniać szerokie klasy zjawisk, kosztem adekwatnoś- 
ci opisu. Te drugie natomiast, opisują konkretne zjawiska i obiekty (np. własności cząstek elemen- 
tarnych). Rozróżnienie wprowadzone przez Cartwright ma istotne znaczenie dla problematyki 
realizmu w filozofii nauki, o czym piszę obszerniej w pracy P. Giza, Realizm I. Hackinga a kon- 
struktywny empiryzm Bas C. van Fraassena, RRR, 1991, t. 23, Lublin, Wyd. UMCS. W tym 
miejscu jednak chodzi mi jedynie o jego znaczenie metodologiczne dla analizy działania systemów 


odkryć. 
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modeli kwarkowych starając się znaleźć najprostszy model pasujący do danych 
wejściowych, tzn. liczb kwantowych „symetrycznych” rodzin cząstek elemen- 
tarnych. 

Opiszę teraz pokrótce wejście, wyjście i funkcjonowanie systemu oraz rezul- 
taty, które udało się przy jego pomocy uzyskać!?, 

Wejście. Na wejściu system wymaga podania listy obiektów scharakteryzowa- 
nych przez te same atrybuty. W klasycznym przypadku wejście systemu stanowią 
„symetryczne rodziny” cząstek elementarnych (hadronów) znane w roku 1964. 

Wyjście. Na wyjściu system generuje listę modeli kwarkowych. Każdy mo- 
del składa się z listy kwarków, ich własności (liczb kwantowych) oraz unikalnej 
kompozycji kwarkowej dla każdej wejściowej cząstki elementarnej. 

Funkcjonowanie. GELL-MANN rozumuje w kilku krokach poprzez kolejne 
stosowanie pięciu operatorów, z których każdy wnosi konkretny wkład w kons- 
trukcję ostatecznego modelu kwarkowego: 

Pierwszy z nich postuluje istnienie N rodzajów kwarków, z których składały- 
by się wszystkie cząsteczki z rodziny danej na wejściu. Drugi operator postuluje 
istnienie struktury kwarkowej hadronów, zakłada on, że każdy z hadronów w 
rodzinie wejściowej składa się z M kwarków, poczynając od najprostszej, 
nietrywialnej hipotezy dla M=2. Kolejny, trzeci operator, generuje wszystkie 
możliwe struktury kwarkowe, czyli kombinacje C(N,M). W jego funkcjonowanie 
ingerują dwie istotne reguły heurystyczne ograniczające przestrzeń poszukiwań. 
Pierwsza z nich wprowadza wymaganie jednoznacznej dekompozycji cząstek 
wejściowych na kwarki, druga odrzuca te rozwiązania, dla których liczba poten- 
cjalnych kombinacji kwarkowych byłaby zbyt duża. Jako graniczną wartość auto- 
rzy przyjmują (być może nieco ad hoc) wartość 2K. Niemniej warunek ten wys- 
tarcza, jak się okazuje, by system znałazł unikalny, najprostszy model kwarkowy. 
Operator trzeci opiera się na wynikach uzyskanych przez dwa poprzednie. 

Czwarty operator jest najbardziej skomplikowany w całym systemie. Postu- 
luje on wartości atrybutów dla kwarków, dokonując przeszukiwania w przestrzeni 
wyznaczonej przez iloczyn kartezjański trzech list: kwarków, atrybutów i możli- 
wych wartości dla każdego atrybutu. Lista kwarków wyznaczona jest przez ope- 
rator pierwszy, atrybuty ograniczają się wyłącznie do występujących cząstek 
wejściowych. Zakres wartości dla każdego atrybutu wyznaczony jest przez war- 


18 Bardziej wyczerpujący opis systemu GELL-MANN oraz historyczne wprowadzenie do 
problemu odkrycia kwarków zawarłem we wspomnianej wyżej pracy P. Giza, Intelligent.... Tam 
też porównuję kryteria oceny i wyboru hipotez stosowanych przez fizyków teoretyków i przez 
maszynowego odkrywcę — GELL-MANN2a. W tej pracy ograniczam się jedynie do pobieżnego 
naświetlenia wspomnianych zagadnień. 


FILOZOFICZNE I METODOLOGICZNE ASPEKTY... 37 


tości dla cząstek wejściowych oraz wartości „odziedziczone” z poprzednio zna- 
lezionych modeli kwarkowych. Ilość możliwych sposobów, na jakie różnym 
kwarkom można przyporządkować wartości ich atrybutów staje się, już przy 
niewielkiej nawet ich liczbie, na tyle duża, że bezpośrednie, pełne przeszukiwa- 
nie jest praktycznie niewykonalne. Stąd też autorzy stosują skomplikowany układ 
reguł heurystycznych umożliwiający oddzielne przeszukiwanie przestrzeni wy- 
znaczonych przez poszczególne atrybuty, a następnie unifikację tak znalezionych 
modeli. 

Ostatni wreszcie, piąty operator, przyporządkowuje każdej cząstce na wejściu 
jedną i tylko jedną kombinację kwarkową. Modele generowane przez ten opera- 
tor podlegają weryfikacji przy użyciu zasady addytywności: wartość danego atry- 
butu dla każdej cząstki jest równa sumie odpowiednich wartości dla kwarków 
składowych. 

Rezultaty. GELL-MANN może pracować na dwa sposoby. W zwykłym try- 
bie pracy system rozważa każdą rodzinę hadronów oddzielnie, za każdym razem 
budując model kwarkowy od zera. W trybie działania stopniowego (incremental 
mode) system rozważając kolejno rodziny hadronów dane mu na wejściu stop- 
niowo uzupełnia i modyfikuje poprzednio otrzymane modele kwarkowe oraz od- 
rzuca modele, które nie pasują do nowych danych. 

Fisher i Żytkow testowali GELL-MANNa na trzech rodzinach hadronów: 
oktecie barionowym, dekuplecie rezonansów barionowych i oktecie mezonowym. 
Program automatycznie kończy działanie dla pierwszych liczb N i M, dla których 
znajdzie on model kwarkowy zgodny z danymi wejściowymi. Nie jest to w spo- 
sób automatyczny równoznaczne z sukcesem. Twórcy GELL-MANNa piszą: 


[...] nie w każdym przypadku znalezienie modelu jest równoznaczne z sukcesem. Jeśli GELL- 
MANN [...] znajdzie wiele modeli, lub jeśli zakończy pracę nie znajdując żadnego modelu, to 
musimy przyznać, że poniósł on porażkę. [...] Jeżeli otrzymujemy wiele równie skomplikowanych 
hipotez kwarkowych w jednakowym stopniu zgodnych z danymi wejściowymi to nie mamy 
powodu wybrać jednej z nich, gdyż nie możemy orzec, że którakolwiek z nich jest bliższa rzeczy- 
wistości niż pozostałe. (Fisher i Żytkow, 1990, s. 367). 


Dla oktetu barionowego i dekupletu rezonansów barionowych system znalazł 
jedno rozwiązanie: model składający się z trzech kwarków w grupach po trzy. 
Rozwiązanie to dokładnie odpowiada modelowi kwarkowemu zaproponowanemu 
przez fizyka Gell-Manna w r. 1964. Jest on jedynym modelem w swojej klasie 
prostoty (simplicity class). 

System miał natomiast poważne problemy z oktetem mezonowym. Zgodnie 
z zaakceptowanym przez fizyków modelem mezony składają się z pary 
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kwark - anty-kwark. GELL-MANN powinien więc poprzez kolejne zwiększanie 
liczb N i M dojść do modelu składającego się z sześciu kwarków w grupach po 
dwa. Jednak przy takiej liczbie kwarków przestrzeń możliwych modeli była zbyt 
duża i autorzy musieli wyłączyć program po około pięciu dniach bezowocnych 
poszukiwań jednoznacznego rozwiązania. 

W przypadku działania stopniowego, a więc udoskonalania i uzupełniania 
kolejnych modeli, system, po znalezieniu jednoznacznego modelu dla oktetu ba- 
rionowego i dekupletu rezonansów barionowych, próbował zastosować go do 
oktetu mezonowego. Uzupełnił on model do czterech, pięciu, a następnie sześciu 
kwarków. Tym razem przestrzeń poszukiwań była już znacznie mniejsza, gdyż 
dotyczyła jedynie atrybutów trzech nowych kwarków i w krótkim czasie GELL- 
MANN znalazł jednoznaczne, najprostsze rozwiązanie dokładnie odpowiadające 
modelowi zaakceptowanemu w fizyce. 

Z powyższej, pobieżnej analizy wynika, że GELL-MANN przy uzasadnianiu 
sformułowanych przez siebie hipotez posługuje się jedynie kryteriami prostoty 
i zgodności z danymi. System nie jest w stanie rozumować na tak wysokim po- 
ziomie abstrakcji i zaawansowanego formalizmu matematycznego, jak twórcy 
modelu kwarkowego. Jednak nawet tak „ubogi” warsztat teoretyczny wystarczy 
mu do znalezienia jednoznacznego modelu kwarkowego, całkowicie zgodnego 
z przyjętym przez fizyków. Człowiek nie miałby raczej szans na uzasadnienie tą 
drogą jakiegokolwiek modelu kwarkowego. Przeszukanie tak ogromnej przes- 
trzeni wszystkich możliwych modeli byłoby dla ludzkiego badacza nie do po- 
myślenia. Dlatego też, jak wspomniałem GELL-MANN i podobne mu systemy 
dostarczają dodatkowego uzasadnienia dla teoretycznie wyprowadzonych hipotez 
na temat mikroskopowej struktury materii. Do kwestii tej powrócę w następnej 
części pracy. 


4. KONKLUZJE 


Systemy odkryć maszynowych przechodzą, od czasów swego powstania 
w latach siedemdziesiątych burzliwy rozwój. Liczba prac opublikowanych w tej 
dziedzinie podwaja się co około 3-4 lata (Żytkow, Automatyzacja... s. 42). Dzie- 
dzina ta może się już pochwalić sporymi osiągnięciami i jeszcze większymi po- 
tencjalnymi możliwościami w niedalekiej, jak sądzę przyszłości. Nasuwa się 
pytanie, jakie znaczenie ma ona dla filozofii nauki i samej nauki? 

Na systemy odkryć, podobnie jak na każdy inny przejaw działalności nauko- 
wej, można spojrzeć z dwu perspektyw: jako na próby mniej lub bardziej wiernej 
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rekonstrukcji komputerowej historycznego procesu odkrycia oraz jako na prog- 
ram jego normatywnej analizy. Historycy nauki przyjmują pierwszy punkt wi- 
dzenia, a filozofowie nauki drugi. 

Historia nauki zajmuje się opisem rzeczywistej drogi, jaką przeszli naukowcy 
na przestrzeni pewnego czasu, starając się zrozumieć kolejne kroki oraz motywy 
postępowania naukowców, które doprowadziły ich do konkretnego odkrycia. 
Tradycyjnie, historycy nauki zadowalali się opisem werbalnym, jednakże wraz 
z pojawieniem się systemów odkryć powstała alternatywna metoda uprawiania 
historii nauki. W tym kontekście na systemy odkryć można spojrzeć jako na 
komputerowe modele historycznego procesu odkrycia. Powstają pytania, czy 
systemy odkryć stanowią adekwatny model tego procesu i jakie kryteria owej 
adekwatności przyjąć? 

Bliższa analiza pokazuje, że historycznie udokumentowane zachowanie się 
badaczy, takich jak Ohm, Coulomb, Black, odbiega od zachowania się programów 
w analogicznych sytuacjach problemowych. Niemniej jednak systemy kompute- 
rowe są w stanie odkryć te same prawa co ludzcy badacze, a to stanowi obiecu- 
jący punkt wyjścia dła dalszych, doskonalszych rekonstrukcji. Stąd też wielu ba- 
daczy sztucznej inteligencji od dawna skłonnych jest poprzestać na słabszych 
wymaganiach stawianych wobec adekwatności modelu odkrycia, żądając na przy- 
kład, aby system odkrycia stanowił jedynie model wystarczający”. Model taki 
nie odtwarza postępowania badaczy we wszystkich detalach a jedynie dysponuje 
podobnymi do nich możliwościami poznawczymi. W każdym razie kwestia, czy 
należy przy konstruowaniu nowych systemów dążyć do jak najwierniejszej repro- 
dukcji zachowań badaczy, czy też poprzestać na słabszych, bardziej pragmatycz- 
nych wymogach, pozostaje nadal otwarta. 

Jeśli idzie o filozofię nauki, to wypada stwierdzić, że systemy odkryć stano- 
wią swoisty przełom i poważne wyzwanie dla niektórych poglądów na temat od- 
krycia naukowego. Większość twórców tych systemów, poza wykształceniem w 
dziedzinie nauk przyrodniczych, żywo interesowało się filozofią nauki. Zdawali 
oni sobie sprawę z faktu, że sam zamiar konstruowania algorytmów dokonują- 
cych odkryć naukowych stanowi zerwanie z tradycyjnymi, utartymi poglądami 
głoszącymi, że filozofia nauki powinna się zajmować kontekstem uzasadniania 
gotowych teorii, a nie procesem ich tworzenia, czy dokonywaniem odkryć. Ten 
ostatni - głosi ów tradycyjny pogląd - może stanowić co najwyżej przedmiot 
badań psychologii czy socjologii nauki”. 


e A. Newell, H. A. Simon, Human Problem Solving, 1972, NY, Prentice Hall. 


20 Patrz, na przykład, klasyczna praca K. Popper, The Logic of Scientific Discovery, 1961, 
New York, Science Editions. 
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Konstrukcja systemów odkryć stanowi program normatywnej analizy procesu 
odkrycia naukowego, dający większe możliwości praktyczne, niż program trady- 
cyjny. Integruje on odkrywanie i uzasadnianie w funkcjonalną całość. Zmusza 
badacza do precyzyjnego wyartykułowania założeń metodologicznych koniecz- 
nych przy konstruowaniu działającego systemu. Z drugiej strony, eksperymenty 
nad gotowymi systemami ujawniają wiele istotnych cech tkwiących w tych zało- 
żeniach. W dziedzinie rozwoju metod heurystycznych stosowanych przez sys- 
temy odkryć dokonuje się widoczny, wymierny postęp. Jego wykładnią jest efek- 
tywność systemów, możliwość „radzenia sobie” z coraz bardziej skompliko- 
wanymi sytuacjami problemowymi. Można tu więc mówić o doskonaleniu 
metody odkrycia naukowego?! 

Tak więc, na teorię odkryć maszynowych można w pewnym sensie spojrzeć 
jak na ścisłą formę uprawiania zarówno historii, jak i filozofii nauki, o dużym 
znaczeniu praktycznym. 

Znaczenie systemów odkryć dla samej nauki jest niemniej ważne i, jak są- 
dzę, będzie ono coraz większe. 

Współcześnie konstruowane systemy dokonujące odkryć empirycznych poz- 
walają zautomatyzować i ogromnie przyspieszyć proste, lecz żmudne prace labo- 
ratoryjne. Są one w stanie wychwycić istotne prawidłowości numeryczne z chao- 
su danych obarczonych błędem pomiaru. Dzięki zastosowaniu sprzężonych z 
komputerem manipulatorów i sensorów, systemy takie są już w stanie same 
sterować wykonywaniem prostych eksperymentów. Można się więc spodziewać, 
że w niedalekiej przyszłości systemy odkryć będą w stanie przejąć funkcję tech- 
nika-laboranta, polegającą na żmudnym powtarzaniu rutynowych eksperymentów 
i przeglądaniu ogromnej liczby danych w celu znalezienia ciekawych prawidło- 
wości. Tyle tylko, że funkcją tę będą one spełniać wielokrotnie szybciej i do- 
kładniej od człowieka. 

Co ważniejsze, systemy ujawniające jak GELL-MANN ukrytą, mikrosko- 
pową strukturę materii nie tylko ponownie dokonują ważnych dla nauki odkryć 
o charakterze teoretycznym, lecz zarazem dostarczają dodatkowych, 
niezależnych argumentów na rzecz konkretnej koncepcji ta- 
kiej struktury. Jak pisałem w poprzedniej części tej pracy, fizycy-teoretycy 
sformułowali hipotezę kwarkową na drodze rozważań teoretycznych o dużym 


21 Wszelkie działania podejmowane przez „inteligentne” systemy związane są z przeszukiwa- 
niem ogromnych z reguły przestrzeni kombinatorycznych. Bardzo rzadko możliwe jest pełne, 
wyczerpujące wszystkie przypadki, przeszukiwanie. Stąd, aby ograniczyć przestrzeń poszukiwań 
stosuje się metody heurystyczne, które w efekcie nie mogą zagwarantować uzyskania optymalnych 
w danych warunkach, rozwiązań, a jedynie rozwiązania efektywne. 
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stopniu abstrakcji, posługując się teorią grup i relatywistyczną, kwantową teorią 
pola. Z drugiej strony, system GELL-MANN doszedł do identycznego, zaakcep- 
towanego przez fizyków modelu kwarkowego „rozumując” na zupełnie innym 
poziomie, który wspomniana przeze mnie w przypisie 17 N. Cartwright określiła- 
by jako poziom praw fenomenologicznych. 

Owa dziwna koincydencja wyników uzyskanych na dwu zupełnie różnych 
drogach stanowi jeden z koronnych argumentów na rzecz realizmu wysuwanych 
przez innego, znanego filozofa nauki, Iana Hackinga. Hacking jest wprawdzie 
realistą w odniesieniu do niektórych przedmiotów teoretycznych, takich jak 
przedmioty mikroskopowe czy tzw. przedmioty eksperymentatora (jak np. elek- 
trony), i przynajmniej na obecnym etapie rozwoju nauki nie uznałby za wystar- 
czające argumenty przemawiające za istnieniem kwarków”. Sądzę jednak, że 
jego argumentację można by rozszerzyć tak, aby przynajmniej dawała dodatkowe 
wsparcie hipotezie kwarkowej, jeśli już nie pozwalałaby na uzasadnienie real- 
ności kwarków). 

„Argument o koincydencji” Hacking odnosi przede wszystkim do przed- 
miotów mikroskopowych. Twierdzi mianowicie, że byłoby nieprawdopodobnym 
zbiegiem okoliczności, gdyby dwa przyrządy, działające na zupełnie różnych za- 
sadach, (np. mikroskop optyczny i mikroskop elektronowy) ujawniły w prepara- 
cie tę samą strukturę mikroskopową, a mimo to struktura ta byłaby jedynie znie- 
kształceniem (artefaktem), a nie czymś, co w preparacie realnie istnieje. Podob- 
ny, choć oczywiście słabszy argument można by, moim zdaniem, przytoczyć na 
rzecz hipotezy kwarkowej: Jeśli dwa, prowadzone na zupełnie różnych pozio- 
mach, rozumowania teoretyczne doprowadzają nas do zbieżnych wyników doty- 
czących zarówno kompozycji kwarkowej hadronów, jak i liczb kwantowych sa- 
mych kwarków, to stanowi to znacznie mocniejsze potwierdzenie hipotezy kwar- 
kowej, niż każdy argument z osobna. Ponadto, hipoteza kwarkowa jest tym lepiej 
uzasadniona, im bardziej owe dwa argumenty są od siebie niezależne. 

W przypadku fizyków-teoretyków i systemu GELL-MANN mamy do czynie- 
nia z dwoma niezależnymi rozumowaniami przeprowadzonymi na poziomach 
wyraźnie rozgraniczonych przez N. Cartwright: to pierwsze — na poziomie ab- 
strakcyjnych teorii wyjaśniających — a drugie - na poziomie praw fenomenolo- 


22 Patrz 1. Hacking, Representing and Intervening, 1983, Cambridge, Cambridge Univ. Press. 
Hacking twierdzi, za mamy wystarczające powody, by uważać za realne jedynie te spośród 
przedmiotów submikroskopowych, które jak elektrony stały się naszymi narzędziami służącymi 
do manipulowania w świecie w celu poznania innych, bardziej hipotetycznych obiektów. Realizm 
Hackinga analizuję obszernie w pracy Giza, Realizm... W tym miejscu eksponuję jedynie te ich 
aspekty, które wydają się mieć znaczenie dla systemów odkryć. 
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gicznych. O znaczeniu poznawczym systemów takich jak GELL-MANN przesą- 
dza fakt, o którym pisałem w poprzedniej części pracy, a mianowicie, że trudno 
sobie wyobrazić, aby ludzcy badacze byli kiedykolwiek w stanie przeprowadzić 
rozumowanie na takim samym, niskim poziomie teoretyczności. 

Rzecz jasna powstaje pytanie, czy systemy komputerowe są w stanie odkryć 
w nauce coś nowego, coś, o czym wcześniej badacze nie wiedzieli? Sceptycy 
twierdzą, że jak dotąd systemy, nawet te najdoskonalsze, dokonywały jedynie 
ponownego odkrycia znanych praw i to w warunkach jak najbardziej sprzyja- 
jących, sztucznie stworzonych przez ich twórców. 

To prawda, że systemy odkryć są mniej autonomiczne niż ludzcy odkrywcy, 
że nie doskonalą one metody a jedynie rozszerzają wiedzę o odkrywanym 
świecie. Niemniej jednak trzeba przyznać, że konkretni uczeni też nie dokonywa- 
li swoich odkryć w próżni. Opierali się oni na wiedzy gromadzonej często całe 
łata przez ich poprzedników. Jest do pomyślenia sytuacja, gdy system dokona 
w laboratorium odkrycia prawa, którego przy obecnym stanie wiedzy nie będzie- 
my mogli właściwie ocenić i zinterpretować, i które być może odrzucimy, jak 
to miało miejsce z wieloma odkryciami znanymi z historii nauki. Bezsprzecznie 
jednak najbliższe badania w tej dziedzinie muszą podążać w kierunku zwiększa- 
nia autonomii systemów. 

Jeszcze trudniejszym zadaniem będzie stworzenie systemów, które mogłyby 
rozumować na poziomie abstrakcyjnych, fundamentalnych teorii wyjaśniających 
szerokie klasy zjawisk i samodzielnie takie teorie rozwijać. 

Tak więc droga do idealnego robota-odkrywcy, o którym wspomniałem na 
wstępie tej pracy jest jeszcze dosyć daleka. 


SUMMARY 


The present paper discusses a fairly new and dynamic field of research in artificial intelligen- 
ce: the Theory of Computer Discovery. The study outlines the historical development of discovery 
systems and their division with respect to the field of application. Finally, perspectives of their 
development and importance both for science itself and philosophy of science were presented. 


